|
1.
基于π演算的足球机器人协作Q学习方法
柯文德 朴松昊 彭志平 蔡则苏 苑全德
计算机应用
2011, 31 (03):
654-656.
DOI: 10.3724/SP.J.1087.2011.00654
针对多机器人协作学习时出现的学习速度慢、学习效率低等问题,提出了一种基于π演算心智模型的足球机器人协作Q学习方法,描述了机器人的运动模型,定义了球场现状、目标、意图、行为、协作、请求、扩展知识、能力判断和联合意图等机器人心智状态,构造了联合奖励函数。最后通过实验验证了方法的有效性。
相关文章 |
多维度评价
|
|